カテゴリ
  1. トップ
  2. 書籍
  3. 音声変換入門
商品詳細画像

音声変換入門

齋藤佑樹 中村泰貴
著作者
齋藤佑樹 中村泰貴
メーカー名/出版社名
講談社
出版年月
2026年4月
ISBNコード
978-4-06-542637-1
(4-06-542637-5)
頁数・縦
分類
工学/電気電子工学 /機械学習・深層学習

価格¥3,600

ただいまお取り扱いがございません。お問い合わせフォームより御見積をご依頼ください。

出版社の商品紹介

出版社からのコメント

最先端の音声変換を支える技術について、前提知識から理論と実装まで一気通貫(end−to−end)に解説。《目次》第1章 音声言語情報処理1.1 音声言語情報処理とは何か1.2 人間の音声生成1.3 人間の音知覚1.4 音声言語データの特徴抽出1.5 本章のまとめ第2章 統計的機械学習2.1 音声から何かを学習するということ2.2 統計的機械学習の手引き2.3 分類タスク2.4 回帰タスク2.5 本章のまとめ第3章 ニューラルネットワークの基礎3.1 単純パーセプトロンから多層パーセプトロンへ3.2 多層パーセプトロンからDNNへ3.3 深層生成モデル3.4 本章のまとめ第4章 実践して学ぶ音声言語情報処理4.1 Google ColabolatoryでのPythonプログラミング4.2 多話者音声コーパスのダウンロードと分析4.3 PyTorchでの深層学習実装4.4 本章のまとめ第5章 深層学習に基づく音声変換5.1 音声変換の定義と分類5.2 作って学ぶ深層学習によるパラレル音声変換第6章 リアルタイム音声変換6.1 バッチ音声変換との違い6.2 ピッチ変換型のリアルタイム音声変換6.3 DNNを用いたリアルタイム音声変換6.4 社会生活での実用例6.5 社会への影響6.6 法的な視点第7章 DNNベースの音声変換モデル7.1 VITSの概要と特徴7.2 VITSのアーキテクチャ第8章 日本語におけるリアルタイム音声変換システムの実装8.1 TextEncoderのContentEncoderへの置換8.2 軽量ボコーダへの置換8.3 モデル構造の因果的変更

  • ※商品代の他に送料がかかります。
    送料は商品代・送付先によって変わります。詳しくは書籍の料金についてのご案内をご確認ください。
  • ※現時点でお取り扱いがない場合でも、今後購入可能となる場合がございます。
  • ※送付先を追加・変更される場合はご購入前にマイページよりご登録をお願いいたします。
  • ※商品は予告なく取り扱い中止となる場合がございます。
  • ※ご注文商品が在庫切れなどの際はキャンセルのご連絡をさせていただく場合がございます。
common-popup-caution

common-popup-caution